Consiste à entraîner des modèles informatiques à effectuer des tâches sans avoir été explicitement programmés pour les accomplir
Les modèles peuvent s’améliorer au fil du temps en apprenant à partir de données
Exemple : Traduction automatique Reconnaissance vocale…
Différence Stat / Machine learning
décrire et comprendre les phénomènes à partir de données
hypothetico-déductive (part d’hypothèses et utilise des tests statistiques pour les vérifier)
données souvent de taille limitée et structurées
modèles simples et faciles à comprendre
prédire les résultats futurs à partir de données passées
inductive (part de données et essaie de déduire les règles sous-jacentes)
peut être utilisé avec des données de grande taille et non structurées
modèles complexes et difficiles à interpréter (réseaux de neurones, arbres de décision)
Apprentissage supervisé
modèle est entraîné sur un jeu de données annotées
Le jeu de données contient des exemples d’entrée et de sortie souhaités
L’objectif: généraliser apprentissage à partir de ces exemples pour prédire la sortie correcte pour de nouvelles entrées
Apprentissage supervisé
\[\hat{y} = f(x, \theta)\]
où \(x\) est l’entrée, \(\theta\) sont les paramètres du modèle et \(\hat{y}\) est la valeur prédite par le modèle pour l’entrée \(x\).
Objectifs : Trouver les valeurs optimales de \(\theta\) qui minimisent l’erreur entre les valeurs prédites et valeurs réelles.
Fonction de coût avec optimisation
Apprentissage non supervisé
Apprentissage non supervisé
Découvrir une structure au sein d’un ensemble d’individus caractérisés par des covariables X
Label est inconnu
Apprentissage non supervisé
\[\hat{y} = f(x, \theta)\]
où \(x\) est l’entrée, \(\theta\) sont les paramètres du modèle et \(\hat{y}\) est la valeur prédite par le modèle pour l’entrée \(x\).
Objectifs : trouver des structures ou des patterns dans les données qui peuvent être utilisés pour effectuer des tâches utiles
Les paramètres du modèle sont mis à jour en utilisant une fonction de coût et une méthode d’optimisation afin de trouver des structures ou des patterns dans les données
Supervisé / Non supervisé
Supervisé / Non supervisé
Apprentissage Actif
Apprentissage par renforcement
Transfer learning
Entrainement d’un modèle
Exemple sur un regression linéaire :
\[Y=X\cdot\theta + \epsilon\]
Solution dans le cadre d’une régression linéaire
On cherche \(\hat{\theta} = \binom{\hat{a}}{\hat{b}}\) où \(\hat{y} = \hat{a}\cdot x+\hat{b}\) pour que \(\hat{y}\) soit le plus proche de \(y\)
Les données sont fausses ?
Les données sont fausses ?
Comment on fait pour entrainer :
On trace une ligne, on mesure la qualité de la ligne tracé, on modifie la ligne pour améliorer ça qualité et on répète
Fonctions de coût
Fonction a minimiser pour trouver la meilleure solution
Comment on fait pour entrainer :
On trace une ligne, on mesure la qualité de la ligne tracé, on modifie la ligne pour améliorer ça qualité et on répète